raw_encuesta <- fread("databases/calidad_vida_ok.csv", encoding = "UTF-8") %>%
as_tibble() %>% mutate(
encuesta_calidad.barrio = case_when(
encuesta_calidad.barrio == "CABECERA ALTAVISTA" ~ "ALTAVISTA",
encuesta_calidad.barrio == "CIUDADELA NUEVO OCCIDENTE" ~ "CABECERA URBANA CORREGIMIENTO SAN CRISTÓBAL",
encuesta_calidad.barrio == "AREA DE EXPANCION SAN CRISTOBAL" ~ "ÁREA DE EXPANSIÓN SAN CRISTÓBAL",
encuesta_calidad.barrio == "CABECERA SAN CRISTÓBAL" ~ "CABECERA URBANA CORREGIMIENTO SAN CRISTÓBAL",
encuesta_calidad.barrio == "SAN CRISTOBAL" ~ "CABECERA URBANA CORREGIMIENTO SAN CRISTÓBAL",
encuesta_calidad.barrio == "PROGRESO Nº 2" ~ "PROGRESO",
TRUE ~ encuesta_calidad.barrio
)
)| encuesta_calidad.barrio | n |
|---|---|
| EL CARMELO | 4 |
| GUAYAQUIL | 4 |
| LA ILUSIÓN | 6 |
| SAN JOSÉ | 10 |
| BOQUERÓN | 15 |
| EL PATIO | 19 |
## encuesta_calidad.p_341
## Min. :1
## 1st Qu.:3
## Median :3
## Mean :3
## 3rd Qu.:3
## Max. :4
## NA's :318530
Con base en la cantidad de dos, se concluye que éste está asociado al “No”, dado que se espera, en general, que el número de personas discapacitadas sea considerablemente menor al de no discapacitadas.
raw_encuesta %>%
dplyr::select(paste0("encuesta_calidad.p_", 50:57)) %>%
mutate_all(as_factor) %>%
summary()## encuesta_calidad.p_50 encuesta_calidad.p_51 encuesta_calidad.p_52
## 1 : 8152 1 : 4173 1 : 8611
## 2 :322190 2 :326095 2 :321663
## NA's: 232 NA's: 306 NA's: 300
## encuesta_calidad.p_53 encuesta_calidad.p_54 encuesta_calidad.p_55
## 1 : 2716 1 : 2752 1 : 4741
## 2 :327543 2 :327491 2 :325460
## NA's: 315 NA's: 331 NA's: 373
## encuesta_calidad.p_56 encuesta_calidad.p_57
## 1 : 4184 1 : 442
## 2 :326059 2 :232249
## NA's: 331 NA's: 97883
encuesta_salud <- raw_encuesta %>%
mutate(discapacidad = case_when(encuesta_calidad.p_50 == 1 ~ 1,
encuesta_calidad.p_51 == 1 ~ 1,
encuesta_calidad.p_52 == 1 ~ 1,
encuesta_calidad.p_53 == 1 ~ 1,
encuesta_calidad.p_54 == 1 ~ 1,
encuesta_calidad.p_55 == 1 ~ 1,
encuesta_calidad.p_56 == 1 ~ 1,
encuesta_calidad.p_57 == 1 ~ 1,
TRUE ~ 0)) %>%
mutate_at(vars(preguntas_categoricas), as_factor) %>%
fastDummies::dummy_cols(remove_selected_columns = TRUE, select_columns = preguntas_categoricas) %>%
mutate(encuesta_calidad.barrio = str_replace(encuesta_calidad.barrio, "ANDALUCIA", "ANDALUCÍA") %>%
str_replace("Nº 2", "NO.2") %>%
str_replace("Nº 1", "NO.1") %>%
str_replace("Nº 3", "NO.3") %>%
str_replace("AREA EXPANSION", "ÁREA DE EXPANSIÓN") %>%
str_replace("EXPANCION", "EXPANSIÓN") %>%
str_replace("AREA", "ÁREA") %>%
str_replace("BOMBONA", "BOMBONÁ") %>%
str_replace("LA ASOMADERA", "ASOMADERA") %>%
str_replace("BELALCAZAR", "BELALCÁZAR") %>%
str_replace("CALAZANS", "CALASANZ") %>%
str_replace("COLON", "COLÓN") %>%
str_replace("MIRA FLORES", "MIRAFLORES") %>%
str_replace("BARRIO FACULTAD DE MINAS", "FACULTAD DE MINAS") %>%
str_replace("CABECERA SAN ANT DE PR.", "SAN ANTONIO DE PRADO") %>%
str_replace("CARLOS E RESTREPO", "CARLOS E. RESTREPO") %>%
str_replace("URQUITA", "URQUITÁ") %>%
str_replace("LOS CERROS EL VERJEL", "LOS CERROS EL VERGEL") %>%
str_replace("CAYCEDO", "CAICEDO") %>%
str_replace("VALDES", "VALDÉS") %>%
str_replace("CERRO EL VOLADOR", "B. CERRO EL VOLADOR") %>%
str_replace("MOSCU", "MOSCÚ") %>%
str_replace("JOSELA", "JOSÉ LA") %>%
str_replace("JOSE", "JOSÉ") %>%
str_replace("EL YOLOMBO", "YOLOMBO") %>%
str_replace("PIEDRAS BLANCAS", "PIEDRAS BLANCAS - MATASANO") %>%
str_replace("BASILIA", "BRASILIA") %>%
str_replace("VILLA TINA", "VILLATINA") %>%
str_replace("LILIAM", "LILLIAM") %>%
str_replace("BOLIVAR", "BOLÍVAR") %>%
str_replace("CORREGIMIENTO PALMITAS", "PALMITAS SECTOR CENTRAL") %>%
str_replace("INES", "INÉS") %>%
str_replace("FE", "FÉ") %>%
str_replace("LUCIA", "LUCÍA") %>%
str_replace("SABIO", "SAVIO") %>%
str_replace("BERMEJAL- LOS ÁLAMOS", "BERMEJAL-LOS ÁLAMOS") %>%
str_replace("BOLÍVARIANA", "BOLIVARIANA") %>%
str_replace("EL NOGAL - LOS ALMENDROS", "EL NOGAL-LOS ALMENDROS") %>%
str_replace("JUAN XXIII - LA QUIEBRA", "JUAN XXIII LA QUIEBRA") %>%
str_replace("PROGRESO Nº 2", "EL PROGRESO") %>%
str_replace("MARIA", "MARÍA") %>%
str_replace("PLAYÓN", "PLAYON") %>%
str_replace("EL SOCORRO / LA GABRIELA", "EL SOCORRO") %>%
str_replace("FÉRRINI", "FERRINI") %>%
str_replace("LA CANDE LARIA", "LA CANDELARIA") %>%
str_replace("EL PLAYON", "PLAYÓN") %>%
str_replace("IGUANA", "IGUANÁ") %>%
str_replace("MARÍA CANO - CARAMBOLAS", "MARÍA CANO-CARAMBOLAS") %>%
str_replace("DE ABURRA", "DEL ABURRÁ") %>%
str_replace("ALTAVISTA CENTRAL", "ALTAVISTA SECTOR CENTRAL") %>%
str_replace("SECTOR CENTRAL", "CENTRO ADMINISTRATIVO") %>%
str_replace("ALTAVISTA CENTRO ADMINISTRATIVO", "ALTAVISTA SECTOR CENTRAL") %>%
str_replace("SANTA ELENA CENTRO ADMINISTRATIVO", "SANTA ELENA SECTOR CENTRAL") %>%
str_replace("PALMITAS CENTRO ADMINISTRATIVO", "PALMITAS SECTOR CENTRAL") %>%
str_replace("PROGRESO", "EL PROGRESO")
)## Note: Using an external vector in selections is ambiguous.
## i Use `all_of(preguntas_categoricas)` instead of `preguntas_categoricas` to silence this message.
## i See <https://tidyselect.r-lib.org/reference/faq-external-vector.html>.
## This message is displayed once per session.
factors <- c("encuesta_calidad.barrio", "encuesta_calidad.comuna")
db_salud <- encuesta_salud %>%
group_by(encuesta_calidad.barrio, encuesta_calidad.comuna) %>%
dplyr::summarize(n = n(),
discapacidad = sum(discapacidad == 1, na.rm = TRUE)/sum(!is.na(discapacidad), na.rm = TRUE),
acceso_salud = mean(`encuesta_calidad.p_265`, na.rm = TRUE),
calidad_salud_1 = sum(`encuesta_calidad.p_266_1` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_266_1`), na.rm = TRUE),
calidad_salud_2 = sum(`encuesta_calidad.p_266_2` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_266_2`), na.rm = TRUE),
calidad_salud_3 = sum(`encuesta_calidad.p_266_3` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_266_3`), na.rm = TRUE),
calidad_salud_4 = sum(`encuesta_calidad.p_266_4` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_266_4`), na.rm = TRUE),
calidad_salud_5 = sum(`encuesta_calidad.p_266_5` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_266_5`), na.rm = TRUE),
morbilidad_30 = sum(`encuesta_calidad.p_324` == 1, na.rm = TRUE)/
sum(!is.na(`encuesta_calidad.p_324`), na.rm = TRUE),
motivo_negacion_1 = sum(`encuesta_calidad.p_326_1` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_326_1`), na.rm = TRUE),
motivo_negacion_2 = sum(`encuesta_calidad.p_326_2` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_326_2`), na.rm = TRUE),
motivo_negacion_3 = sum(`encuesta_calidad.p_326_3` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_326_3`), na.rm = TRUE),
motivo_negacion_4 = sum(`encuesta_calidad.p_326_4` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_326_4`), na.rm = TRUE),
motivo_negacion_5 = sum(`encuesta_calidad.p_326_5` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_326_5`), na.rm = TRUE),
motivo_negacion_6 = sum(`encuesta_calidad.p_326_6` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_326_6`), na.rm = TRUE),
motivo_negacion_7 = sum(`encuesta_calidad.p_326_7` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_326_7`), na.rm = TRUE),
motivo_negacion_8 = sum(`encuesta_calidad.p_326_8` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_326_8`), na.rm = TRUE),
motivo_negacion_9 = sum(`encuesta_calidad.p_326_9` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_326_9`), na.rm = TRUE),
conteo_prevencion = median(`encuesta_calidad.p_328`, na.rm = TRUE),
calidad_prevencion_1 = sum(`encuesta_calidad.p_329_1` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_329_1`), na.rm = TRUE),
calidad_prevencion_2 = sum(`encuesta_calidad.p_329_2` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_329_2`), na.rm = TRUE),
calidad_prevencion_3 = sum(`encuesta_calidad.p_329_3` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_329_3`), na.rm = TRUE),
calidad_prevencion_4 = sum(`encuesta_calidad.p_329_4` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_329_4`), na.rm = TRUE),
consulta_medico_general = mean(`encuesta_calidad.p_331`, na.rm = TRUE),
calidad_med_general_1 = sum(`encuesta_calidad.p_332_1` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_332_1`), na.rm = TRUE),
calidad_med_general_2 = sum(`encuesta_calidad.p_332_2` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_332_2`), na.rm = TRUE),
calidad_med_general_3 = sum(`encuesta_calidad.p_332_3` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_332_3`), na.rm = TRUE),
calidad_med_general_4 = sum(`encuesta_calidad.p_332_4` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_332_4`), na.rm = TRUE),
consulta_medico_especialista = mean(`encuesta_calidad.p_334`, na.rm = TRUE),
calidad_med_especial_1 = sum(`encuesta_calidad.p_335_1` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_335_1`), na.rm = TRUE),
calidad_med_especial_2 = sum(`encuesta_calidad.p_335_2` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_335_2`), na.rm = TRUE),
calidad_med_especial_3 = sum(`encuesta_calidad.p_335_3` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_335_3`), na.rm = TRUE),
calidad_med_especial_4 = sum(`encuesta_calidad.p_335_4` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_335_4`), na.rm = TRUE),
consulta_urgencias = mean(`encuesta_calidad.p_337`, na.rm = TRUE),
calidad_urgencias_1 = sum(`encuesta_calidad.p_338_1` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_338_1`), na.rm = TRUE),
calidad_urgencias_2 = sum(`encuesta_calidad.p_338_2` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_338_2`), na.rm = TRUE),
calidad_urgencias_3 = sum(`encuesta_calidad.p_338_3` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_338_3`), na.rm = TRUE),
calidad_urgencias_4 = sum(`encuesta_calidad.p_338_4` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_338_4`), na.rm = TRUE),
hospitalizacion = mean(`encuesta_calidad.p_340`, na.rm = TRUE),
calidad_hospitalizacion_1 = sum(`encuesta_calidad.p_341_1` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_341_1`), na.rm = TRUE),
calidad_hospitalizacion_2 = sum(`encuesta_calidad.p_341_2` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_341_2`), na.rm = TRUE),
calidad_hospitalizacion_3 = sum(`encuesta_calidad.p_341_3` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_341_3`), na.rm = TRUE),
calidad_hospitalizacion_4 = sum(`encuesta_calidad.p_341_4` == 1, na.rm = TRUE)/sum(!is.na(`encuesta_calidad.p_341_4`), na.rm = TRUE),
) %>% ungroup() %>%
mutate_all(~replace_na(., 0)) %>%
mutate_at(factors, as_factor) %>%
filter(encuesta_calidad.barrio != "DESCONOCIDO")
db_salud %>%
head()| encuesta_calidad.barrio | encuesta_calidad.comuna | n | discapacidad | acceso_salud | calidad_salud_1 | calidad_salud_2 | calidad_salud_3 | calidad_salud_4 | calidad_salud_5 | morbilidad_30 | motivo_negacion_1 | motivo_negacion_2 | motivo_negacion_3 | motivo_negacion_4 | motivo_negacion_5 | motivo_negacion_6 | motivo_negacion_7 | motivo_negacion_8 | motivo_negacion_9 | conteo_prevencion | calidad_prevencion_1 | calidad_prevencion_2 | calidad_prevencion_3 | calidad_prevencion_4 | consulta_medico_general | calidad_med_general_1 | calidad_med_general_2 | calidad_med_general_3 | calidad_med_general_4 | consulta_medico_especialista | calidad_med_especial_1 | calidad_med_especial_2 | calidad_med_especial_3 | calidad_med_especial_4 | consulta_urgencias | calidad_urgencias_1 | calidad_urgencias_2 | calidad_urgencias_3 | calidad_urgencias_4 | hospitalizacion | calidad_hospitalizacion_1 | calidad_hospitalizacion_2 | calidad_hospitalizacion_3 | calidad_hospitalizacion_4 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| AGUAS FRÍAS | ALTAVISTA | 126 | 0.0634921 | 2.793651 | 0.0555556 | 0.3888889 | 0.2222222 | 0.1111111 | 0.2222222 | 0.2173913 | 0.0000000 | 0.0000000 | 0 | 0.0000000 | 0.0000000 | 0.0000000 | 0 | 0 | 0.0000000 | 1.5 | 0.2 | 0.3000000 | 0.5000000 | 0.0000000 | 4.033333 | 0.0666667 | 0.1000000 | 0.7666667 | 0.0666667 | 3.076923 | 0.0000000 | 0.0000000 | 0.8461538 | 0.1538462 | 1.352941 | 0.0000000 | 0.0000000 | 0.8235294 | 0.1764706 | 2.000000 | 0.0000000 | 0.0000000 | 0.8000000 | 0.2000000 |
| ALDEA PABLO VI | POPULAR | 426 | 0.0492958 | 3.000000 | 0.0448113 | 0.1297170 | 0.2948113 | 0.4504717 | 0.0801887 | 0.1918605 | 0.0000000 | 0.0000000 | 0 | 0.2500000 | 0.0000000 | 0.0000000 | 0 | 0 | 0.7500000 | 1.0 | 0.0 | 0.0000000 | 0.9047619 | 0.0952381 | 1.897959 | 0.0000000 | 0.2244898 | 0.6122449 | 0.1632653 | 1.837838 | 0.0810811 | 0.0000000 | 0.5945946 | 0.3243243 | 2.176471 | 0.1764706 | 0.0000000 | 0.5882353 | 0.2352941 | 1.000000 | 0.0000000 | 0.0000000 | 1.0000000 | 0.0000000 |
| ALEJANDRÍA | EL POBLADO | 709 | 0.0606488 | 3.187683 | 0.0640466 | 0.1630277 | 0.2358079 | 0.4061135 | 0.1310044 | 0.1228448 | 1.0000000 | 0.0000000 | 0 | 0.0000000 | 0.0000000 | 0.0000000 | 0 | 0 | 0.0000000 | 2.0 | 0.0 | 0.0312500 | 0.9218750 | 0.0468750 | 2.637795 | 0.0708661 | 0.0472441 | 0.7007874 | 0.1811024 | 2.098159 | 0.0122699 | 0.0000000 | 0.6380368 | 0.3496933 | 1.506849 | 0.0684932 | 0.1232877 | 0.6438356 | 0.1643836 | 1.142857 | 0.0000000 | 0.0000000 | 0.8095238 | 0.1904762 |
| ALEJANDRO ECHAVARRÍA | BUENOS AIRES | 1094 | 0.0557587 | 3.008349 | 0.0593692 | 0.2124304 | 0.3153989 | 0.3191095 | 0.0936920 | 0.1242515 | 0.1818182 | 0.1818182 | 0 | 0.0000000 | 0.3636364 | 0.0000000 | 0 | 0 | 0.2727273 | 2.0 | 0.0 | 0.0833333 | 0.6428571 | 0.2738095 | 3.480100 | 0.0099502 | 0.1990050 | 0.6990050 | 0.0920398 | 2.483516 | 0.0256410 | 0.0476190 | 0.7838828 | 0.1428571 | 2.406667 | 0.2000000 | 0.2333333 | 0.4933333 | 0.0733333 | 1.612903 | 0.0967742 | 0.2419355 | 0.5483871 | 0.1129032 |
| ALFONSO LÓPEZ | CASTILLA | 1994 | 0.0737212 | 2.928390 | 0.0696846 | 0.2024415 | 0.2802645 | 0.3672431 | 0.0803662 | 0.1804424 | 0.4883721 | 0.0000000 | 0 | 0.1162791 | 0.1395349 | 0.0697674 | 0 | 0 | 0.1860465 | 2.0 | 0.0 | 0.1346154 | 0.7980769 | 0.0673077 | 2.635910 | 0.0748130 | 0.2094763 | 0.6658354 | 0.0498753 | 2.162162 | 0.0405405 | 0.1756757 | 0.7027027 | 0.0810811 | 1.552764 | 0.1959799 | 0.2814070 | 0.4924623 | 0.0301508 | 1.063492 | 0.0000000 | 0.0793651 | 0.7142857 | 0.2063492 |
| ALTAMIRA | ROBLEDO | 755 | 0.0622517 | 2.842876 | 0.0519308 | 0.2250333 | 0.3941411 | 0.2396804 | 0.0892144 | 0.1082251 | 0.3333333 | 0.0000000 | 0 | 0.0000000 | 0.6666667 | 0.0000000 | 0 | 0 | 0.0000000 | 2.0 | 0.0 | 0.0000000 | 0.8750000 | 0.1250000 | 3.175439 | 0.0614035 | 0.1798246 | 0.6973684 | 0.0614035 | 2.338710 | 0.0322581 | 0.1693548 | 0.5806452 | 0.2177419 | 1.867647 | 0.2794118 | 0.2500000 | 0.4705882 | 0.0000000 | 1.142857 | 0.0000000 | 0.0000000 | 1.0000000 | 0.0000000 |
Para la discapacidad
## encuesta_calidad.barrio encuesta_calidad.comuna n
## SAN PABLO : 3 EL POBLADO : 22 Min. : 4.0
## ALTAVISTA : 2 ROBLEDO : 22 1st Qu.: 348.8
## EL LLANO : 2 BELEN : 21 Median : 862.5
## EL SALADO : 2 SAN CRISTOBAL: 20 Mean :1073.2
## LA ESPERANZA: 2 SAN JAVIER : 19 3rd Qu.:1439.0
## LA FLORIDA : 2 VILLA HERMOSA: 18 Max. :8987.0
## (Other) :295 (Other) :186
## discapacidad acceso_salud calidad_salud_1 calidad_salud_2
## Min. :0.00000 Min. :2.339 Min. :0.00000 Min. :0.0000
## 1st Qu.:0.05731 1st Qu.:2.871 1st Qu.:0.05246 1st Qu.:0.1452
## Median :0.06985 Median :2.955 Median :0.06958 Median :0.1685
## Mean :0.07277 Mean :2.957 Mean :0.07624 Mean :0.1745
## 3rd Qu.:0.08214 3rd Qu.:3.048 3rd Qu.:0.09238 3rd Qu.:0.1956
## Max. :0.50000 Max. :3.656 Max. :0.50000 Max. :0.8667
##
## calidad_salud_3 calidad_salud_4 calidad_salud_5 morbilidad_30
## Min. :0.0000 Min. :0.0000 Min. :0.00000 Min. :0.0000
## 1st Qu.:0.2918 1st Qu.:0.3022 1st Qu.:0.06175 1st Qu.:0.1059
## Median :0.3285 Median :0.3345 Median :0.08171 Median :0.1413
## Mean :0.3306 Mean :0.3339 Mean :0.08474 Mean :0.1423
## 3rd Qu.:0.3618 3rd Qu.:0.3721 3rd Qu.:0.10248 3rd Qu.:0.1787
## Max. :1.0000 Max. :0.6750 Max. :0.28378 Max. :0.5714
##
## motivo_negacion_1 motivo_negacion_2 motivo_negacion_3 motivo_negacion_4
## Min. :0.0000 Min. :0.00000 Min. :0.00000 Min. :0.00000
## 1st Qu.:0.0000 1st Qu.:0.00000 1st Qu.:0.00000 1st Qu.:0.00000
## Median :0.2918 Median :0.00000 Median :0.00000 Median :0.00000
## Mean :0.3285 Mean :0.04847 Mean :0.02234 Mean :0.09997
## 3rd Qu.:0.5411 3rd Qu.:0.00000 3rd Qu.:0.00000 3rd Qu.:0.15486
## Max. :1.0000 Max. :1.00000 Max. :1.00000 Max. :1.00000
##
## motivo_negacion_5 motivo_negacion_6 motivo_negacion_7 motivo_negacion_8
## Min. :0.0000 Min. :0.00000 Min. :0.00000 Min. :0.00000
## 1st Qu.:0.0000 1st Qu.:0.00000 1st Qu.:0.00000 1st Qu.:0.00000
## Median :0.0000 Median :0.00000 Median :0.00000 Median :0.00000
## Mean :0.1205 Mean :0.03756 Mean :0.02806 Mean :0.03153
## 3rd Qu.:0.1895 3rd Qu.:0.00000 3rd Qu.:0.00000 3rd Qu.:0.00000
## Max. :1.0000 Max. :1.00000 Max. :1.00000 Max. :1.00000
##
## motivo_negacion_9 conteo_prevencion calidad_prevencion_1 calidad_prevencion_2
## Min. :0.00000 Min. : 0.00 Min. :0.00000 Min. :0.00000
## 1st Qu.:0.00000 1st Qu.: 1.00 1st Qu.:0.00000 1st Qu.:0.00000
## Median :0.00000 Median : 1.75 Median :0.00000 Median :0.05109
## Mean :0.09159 Mean : 1.76 Mean :0.01878 Mean :0.07173
## 3rd Qu.:0.10000 3rd Qu.: 2.00 3rd Qu.:0.02941 3rd Qu.:0.11111
## Max. :1.00000 Max. :12.00 Max. :0.35484 Max. :0.71429
##
## calidad_prevencion_3 calidad_prevencion_4 consulta_medico_general
## Min. :0.0000 Min. :0.00000 Min. :0.000
## 1st Qu.:0.7074 1st Qu.:0.00000 1st Qu.:2.535
## Median :0.8006 Median :0.07376 Median :2.908
## Mean :0.7540 Mean :0.10352 Mean :2.978
## 3rd Qu.:0.8830 3rd Qu.:0.15427 3rd Qu.:3.357
## Max. :1.0000 Max. :1.00000 Max. :8.400
##
## calidad_med_general_1 calidad_med_general_2 calidad_med_general_3
## Min. :0.00000 Min. :0.00000 Min. :0.0000
## 1st Qu.:0.02015 1st Qu.:0.08371 1st Qu.:0.6586
## Median :0.04809 Median :0.13869 Median :0.7138
## Mean :0.05246 Mean :0.13405 Mean :0.7097
## 3rd Qu.:0.07143 3rd Qu.:0.18340 3rd Qu.:0.7706
## Max. :0.66667 Max. :0.57143 Max. :1.0000
##
## calidad_med_general_4 consulta_medico_especialista calidad_med_especial_1
## Min. :0.00000 Min. :0.000 Min. :0.00000
## 1st Qu.:0.04827 1st Qu.:1.928 1st Qu.:0.00000
## Median :0.08281 Median :2.267 Median :0.02113
## Mean :0.09077 Mean :2.289 Mean :0.03407
## 3rd Qu.:0.11986 3rd Qu.:2.602 3rd Qu.:0.04721
## Max. :0.55556 Max. :5.833 Max. :0.61538
##
## calidad_med_especial_2 calidad_med_especial_3 calidad_med_especial_4
## Min. :0.00000 Min. :0.0000 Min. :0.00000
## 1st Qu.:0.01903 1st Qu.:0.6403 1st Qu.:0.07966
## Median :0.06848 Median :0.7098 Median :0.14866
## Mean :0.08072 Mean :0.6989 Mean :0.16034
## 3rd Qu.:0.11662 3rd Qu.:0.7801 3rd Qu.:0.21807
## Max. :0.70000 Max. :1.0000 Max. :1.00000
##
## consulta_urgencias calidad_urgencias_1 calidad_urgencias_2 calidad_urgencias_3
## Min. :0.000 Min. :0.00000 Min. :0.0000 Min. :0.0000
## 1st Qu.:1.571 1st Qu.:0.07508 1st Qu.:0.1049 1st Qu.:0.4608
## Median :1.869 Median :0.16441 Median :0.1732 Median :0.5409
## Mean :1.943 Mean :0.17173 Mean :0.1743 Mean :0.5448
## 3rd Qu.:2.235 3rd Qu.:0.22982 3rd Qu.:0.2474 3rd Qu.:0.6250
## Max. :9.312 Max. :1.00000 Max. :1.0000 Max. :1.0000
##
## calidad_urgencias_4 hospitalizacion calidad_hospitalizacion_1
## Min. :0.0000 Min. :0.000 Min. :0.00000
## 1st Qu.:0.0000 1st Qu.:1.072 1st Qu.:0.00000
## Median :0.0553 Median :1.360 Median :0.00000
## Mean :0.0800 Mean :1.432 Mean :0.04243
## 3rd Qu.:0.1025 3rd Qu.:1.667 3rd Qu.:0.06130
## Max. :1.0000 Max. :6.000 Max. :0.71429
##
## calidad_hospitalizacion_2 calidad_hospitalizacion_3 calidad_hospitalizacion_4
## Min. :0.00000 Min. :0.0000 Min. :0.0000
## 1st Qu.:0.00000 1st Qu.:0.5225 1st Qu.:0.0000
## Median :0.05064 Median :0.6667 Median :0.1346
## Mean :0.09972 Mean :0.6287 Mean :0.1610
## 3rd Qu.:0.15016 3rd Qu.:0.7968 3rd Qu.:0.2363
## Max. :1.00000 Max. :1.0000 Max. :1.0000
##
db_salud %>%
group_by(encuesta_calidad.barrio) %>%
dplyr::summarize(media = mean(discapacidad), minimo = min(discapacidad), maximo = max(discapacidad)) %>%
arrange(desc(maximo)) %>%
head()| encuesta_calidad.barrio | media | minimo | maximo |
|---|---|---|---|
| GUAYAQUIL | 0.5000000 | 0.5000000 | 0.5000000 |
| SAN JOSÉ | 0.3000000 | 0.3000000 | 0.3000000 |
| EL PLACER | 0.1801802 | 0.1801802 | 0.1801802 |
| FACULTAD DE MINAS | 0.1698113 | 0.1698113 | 0.1698113 |
| CORAZÓN DE JESÚS | 0.1384615 | 0.1384615 | 0.1384615 |
| LA SUCIA | 0.1379310 | 0.1379310 | 0.1379310 |
| encuesta_calidad.barrio | encuesta_calidad.comuna | n | discapacidad | acceso_salud | calidad_salud_1 | calidad_salud_2 | calidad_salud_3 | calidad_salud_4 | calidad_salud_5 | morbilidad_30 | motivo_negacion_1 | motivo_negacion_2 | motivo_negacion_3 | motivo_negacion_4 | motivo_negacion_5 | motivo_negacion_6 | motivo_negacion_7 | motivo_negacion_8 | motivo_negacion_9 | conteo_prevencion | calidad_prevencion_1 | calidad_prevencion_2 | calidad_prevencion_3 | calidad_prevencion_4 | consulta_medico_general | calidad_med_general_1 | calidad_med_general_2 | calidad_med_general_3 | calidad_med_general_4 | consulta_medico_especialista | calidad_med_especial_1 | calidad_med_especial_2 | calidad_med_especial_3 | calidad_med_especial_4 | consulta_urgencias | calidad_urgencias_1 | calidad_urgencias_2 | calidad_urgencias_3 | calidad_urgencias_4 | hospitalizacion | calidad_hospitalizacion_1 | calidad_hospitalizacion_2 | calidad_hospitalizacion_3 | calidad_hospitalizacion_4 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| EL CARMELO | SAN CRISTOBAL | 4 | 0.0 | 3.000000 | 0.0000000 | 0.0000000 | 1.0000000 | 0.0000000 | 0.0 | 0.0000000 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0.000000 | 0 | 0.0000000 | 0.0000000 | 0 | 0 | 0 | 0 | 0.0 | 0.0 | 0 | 0.0 | 0 | 0.0 | 0 | 0 | 0 | 0 | 0 | 0 |
| GUAYAQUIL | LA CANDELARIA | 4 | 0.5 | 2.500000 | 0.5000000 | 0.0000000 | 0.0000000 | 0.5000000 | 0.0 | 0.0000000 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 2 | 0 | 0 | 1 | 0 | 3.000000 | 0 | 0.0000000 | 1.0000000 | 0 | 2 | 0 | 0 | 1.0 | 0.0 | 5 | 0.0 | 0 | 1.0 | 0 | 1 | 0 | 0 | 1 | 0 |
| LA ILUSIÓN | SAN CRISTOBAL | 6 | 0.0 | 3.500000 | 0.0000000 | 0.0000000 | 1.0000000 | 0.0000000 | 0.0 | 0.0000000 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0.000000 | 0 | 0.0000000 | 0.0000000 | 0 | 0 | 0 | 0 | 0.0 | 0.0 | 0 | 0.0 | 0 | 0.0 | 0 | 0 | 0 | 0 | 0 | 0 |
| SAN PABLO | GUAYABAL | 9 | 0.0 | 2.555556 | 0.4444444 | 0.0000000 | 0.5555556 | 0.0000000 | 0.0 | 0.1111111 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 5.400000 | 0 | 0.0000000 | 1.0000000 | 0 | 2 | 0 | 0 | 0.8 | 0.2 | 1 | 0.8 | 0 | 0.2 | 0 | 1 | 0 | 0 | 1 | 0 |
| SAN JOSÉ | SAN ANTONIO DE PRADO | 10 | 0.3 | 2.800000 | 0.0000000 | 0.2000000 | 0.0000000 | 0.6000000 | 0.2 | 0.0000000 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 2 | 0 | 0 | 1 | 0 | 1.000000 | 0 | 0.0000000 | 1.0000000 | 0 | 0 | 0 | 0 | 0.0 | 0.0 | 2 | 0.0 | 0 | 1.0 | 0 | 0 | 0 | 0 | 0 | 0 |
| BOQUERÓN | SAN CRISTOBAL | 15 | 0.0 | 2.466667 | 0.0000000 | 0.8666667 | 0.0000000 | 0.1333333 | 0.0 | 0.3076923 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 3 | 0 | 0 | 1 | 0 | 5.857143 | 0 | 0.5714286 | 0.4285714 | 0 | 0 | 0 | 0 | 0.0 | 0.0 | 2 | 0.0 | 0 | 1.0 | 0 | 0 | 0 | 0 | 0 | 0 |
Luego de identificar los barrios con pocas observaciones, se asumirá que el muestreo fue realizado correctamente y por lo tanto consideramos inclusive las muestras con 4 observaciones como significativas, por lo que no se alterarán las conclusiones con respecto a los máximos y mínimos por cada variable.
## Observations: 308
## Variables: 45
## $ encuesta_calidad.barrio <fct> AGUAS FRÍAS, ALDEA PABLO VI, ALEJANDRÍ...
## $ encuesta_calidad.comuna <fct> ALTAVISTA, POPULAR, EL POBLADO, BUENOS...
## $ n <dbl> 126, 426, 709, 1094, 1994, 755, 168, 1...
## $ discapacidad <dbl> 0.06349206, 0.04929577, 0.06064880, 0....
## $ acceso_salud <dbl> 2.793651, 3.000000, 3.187683, 3.008349...
## $ calidad_salud_1 <dbl> 0.05555556, 0.04481132, 0.06404658, 0....
## $ calidad_salud_2 <dbl> 0.38888889, 0.12971698, 0.16302766, 0....
## $ calidad_salud_3 <dbl> 0.2222222, 0.2948113, 0.2358079, 0.315...
## $ calidad_salud_4 <dbl> 0.1111111, 0.4504717, 0.4061135, 0.319...
## $ calidad_salud_5 <dbl> 0.22222222, 0.08018868, 0.13100437, 0....
## $ morbilidad_30 <dbl> 0.21739130, 0.19186047, 0.12284483, 0....
## $ motivo_negacion_1 <dbl> 0.0000000, 0.0000000, 1.0000000, 0.181...
## $ motivo_negacion_2 <dbl> 0.0000000, 0.0000000, 0.0000000, 0.181...
## $ motivo_negacion_3 <dbl> 0.0000000, 0.0000000, 0.0000000, 0.000...
## $ motivo_negacion_4 <dbl> 0.00000000, 0.25000000, 0.00000000, 0....
## $ motivo_negacion_5 <dbl> 0.0000000, 0.0000000, 0.0000000, 0.363...
## $ motivo_negacion_6 <dbl> 0.00000000, 0.00000000, 0.00000000, 0....
## $ motivo_negacion_7 <dbl> 0.0000000, 0.0000000, 0.0000000, 0.000...
## $ motivo_negacion_8 <dbl> 0.00000000, 0.00000000, 0.00000000, 0....
## $ motivo_negacion_9 <dbl> 0.00000000, 0.75000000, 0.00000000, 0....
## $ conteo_prevencion <dbl> 1.5, 1.0, 2.0, 2.0, 2.0, 2.0, 0.0, 2.0...
## $ calidad_prevencion_1 <dbl> 0.200000000, 0.000000000, 0.000000000,...
## $ calidad_prevencion_2 <dbl> 0.30000000, 0.00000000, 0.03125000, 0....
## $ calidad_prevencion_3 <dbl> 0.5000000, 0.9047619, 0.9218750, 0.642...
## $ calidad_prevencion_4 <dbl> 0.00000000, 0.09523810, 0.04687500, 0....
## $ consulta_medico_general <dbl> 4.033333, 1.897959, 2.637795, 3.480100...
## $ calidad_med_general_1 <dbl> 0.066666667, 0.000000000, 0.070866142,...
## $ calidad_med_general_2 <dbl> 0.10000000, 0.22448980, 0.04724409, 0....
## $ calidad_med_general_3 <dbl> 0.7666667, 0.6122449, 0.7007874, 0.699...
## $ calidad_med_general_4 <dbl> 0.066666667, 0.163265306, 0.181102362,...
## $ consulta_medico_especialista <dbl> 3.076923, 1.837838, 2.098160, 2.483516...
## $ calidad_med_especial_1 <dbl> 0.00000000, 0.08108108, 0.01226994, 0....
## $ calidad_med_especial_2 <dbl> 0.00000000, 0.00000000, 0.00000000, 0....
## $ calidad_med_especial_3 <dbl> 0.8461538, 0.5945946, 0.6380368, 0.783...
## $ calidad_med_especial_4 <dbl> 0.15384615, 0.32432432, 0.34969325, 0....
## $ consulta_urgencias <dbl> 1.352941, 2.176471, 1.506849, 2.406667...
## $ calidad_urgencias_1 <dbl> 0.00000000, 0.17647059, 0.06849315, 0....
## $ calidad_urgencias_2 <dbl> 0.0000000, 0.0000000, 0.1232877, 0.233...
## $ calidad_urgencias_3 <dbl> 0.8235294, 0.5882353, 0.6438356, 0.493...
## $ calidad_urgencias_4 <dbl> 0.17647059, 0.23529412, 0.16438356, 0....
## $ hospitalizacion <dbl> 2.000000, 1.000000, 1.142857, 1.612903...
## $ calidad_hospitalizacion_1 <dbl> 0.00000000, 0.00000000, 0.00000000, 0....
## $ calidad_hospitalizacion_2 <dbl> 0.00000000, 0.00000000, 0.00000000, 0....
## $ calidad_hospitalizacion_3 <dbl> 0.8000000, 1.0000000, 0.8095238, 0.548...
## $ calidad_hospitalizacion_4 <dbl> 0.20000000, 0.00000000, 0.19047619, 0....
salud_cor <- db_salud %>%
select_if(is.numeric) %>%
dplyr::select(-n) %>%
.[complete.cases(.),] %>%
cor()
corrplot(salud_cor, type = "upper", order = "hclust", tl.col = "black", tl.srt = 45)# Mapa gigante de correlación con factores y números Inviable por número de variables
# db_salud %>%
# select(-encuesta_calidad.barrio, -encuesta_calidad.comuna, -n) %>%
# ggpairs(aes(alpha = 0.4))No se identifican correlaciones notorias entre las variables numéricas, se nota que hay ciertas variables con distribuciones marcadas, como el acceso a salud con una función de densidad de probabilidad muy similar a la distribución normal y otras variables con distribuciones con sesgos hacia la izquierda.
Pendiente
clustering_salud <- salud_scaled %>%
dplyr::select(-n, -encuesta_calidad.barrio, -encuesta_calidad.comuna)
k_maximo <- 15
wss <- sapply(1:k_maximo,
function(k) {
kmeans(clustering_salud, k, nstart = 10, iter.max = 15 )$tot.withinss
})
plot(1:k_maximo, wss,
type="b", pch = 19, frame = FALSE,
xlab="Número de grupos [K]",
ylab="Total de suma de cuadrados intra-grupos")Para favorecer la interpretabilidad y teniendo en cuenta que no hay agrupamientos incorrectos, se decide utilizar k_seleccionado grupos y realizar su análisis descriptivo que permita llegar a conclusiones dicientes de los barrios analizados.
Falta
political <- shapefile("Barrio_Vereda/Barrio_Vereda.shp")
Encoding(political@data$NOMBRE) <- "UTF-8"
political$NOMBRE <- political$NOMBRE %>% toupper() %>% str_replace("DE MESA", "DE MESA")
grupos_barrios <- data.frame(barrio_nombre = db_salud$encuesta_calidad.barrio, grupo = agrupamiento_kmeans$cluster)
nombres_mapa <- data.frame(nombre_barrio = political$NOMBRE)
vector_nombres = c()
vector_grupos = c()
for(nombre_mapa in nombres_mapa$nombre_barrio) {
grupo <- grupos_barrios[grupos_barrios$barrio_nombre == nombre_mapa, 2][1]
vector_nombres <- c(vector_nombres, nombre_mapa)
vector_grupos <- c(vector_grupos, grupo)
}
mapa_grupos <- data.frame(
nombre_barrio = vector_nombres,
grupo = vector_grupos
)
factpal <- colorFactor(rainbow(k_optimo_kmeans), mapa_grupos$grupo)
leaflet(data = political) %>%
addTiles() %>%
addProviderTiles(providers$OpenStreetMap) %>%
addPolygons(fill = TRUE, stroke = TRUE, weight = 2, color = ~factpal(mapa_grupos$grupo),
label = as.character(political$NOMBRE),
popup = as.character(political$NOMBRE)) %>%
addLegend("bottomright", colors = "#03F", labels = "Barrios y veredas")